Evaluation des performances d'un système de recherche d'information utilisant un algorithme de segmentation thématique de pages Web
نویسندگان
چکیده
In this paper, we explore the use of new page segmentation algorithm using both visual and structural mark-up (,) to partition web pages into blocks and investigate how to take advantage of block-level evidence to improve retrieval performance in the web. We propose a new ranking function that combines content and link rank based on propagation of scores over links on block-to-page graph. This function propagates scores from blocks of source pages to destination pages in relation with query terms. Our approach shows good results over TREC collections. MOTS-CLÉS : recherche d’information, systèmes hypertextes, analyse de liens, web, propagation de pertinence, méthodes de segmentation, analyse thématique.
منابع مشابه
Étude Comparative des Algorithmes de Segmentation Thématique Pour la Langue Arabe
Résumé. Le besoin d'avoir un système de segmentation thématique des textes arabesa pour but d’améliorer les fonctionnalités de la Recherche d'Information Arabe (RIA). La segmentation thématique des textes a été utilisée pour améliorer la précision des processus subséquents telle que les systèmes de résumé automatique, les systèmes de Question/Réponses et les systèmes de recherche d’information....
متن کاملExpérimentations sur un modèle de recherche d'information utilisant les liens hypertextes des pages Web
Résumé. La fonction de correspondance, qui permet de sélectionner et de classer les documents par rapport à une requête est un composant essentiel dans tout système de recherche d'information. Nous proposons de modéliser une fonction de correspondance prenant en compte à la fois le contenu et les liens hypertextes des pages Web. Nous avons expérimenté notre système sur la collection de test TRE...
متن کاملRésumé automatique de texte avec un algorithme d'ordonnancement
Résumé: Dans cet article, nous proposons une nouvelle approche pour le résumé automatique de textes utilisant un algorithme d'apprentissage numérique spécifique à la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus représentatives de son contenu. Pour se faire, chaque phrase d'un document est représentée par un vecteur de scores de pertinence, où cha...
متن کاملVers l'échantillonnage d'un entrepôt de données
Résumé. L'afflux de données sur les usages des produits et services nécessite des traitements lourds pour les transformer en information. Or la capacité à traiter les données ne peut pas suivre l'augmentation exponentielle des volumes stockés. Avec les technologies actuelles, un difficile compromis doit être trouvé entre le coût de mise en œuvre et la qualité de l'information produite. Nous pro...
متن کاملProposition d'un Modèle pour Ordonnancement d'un Système Automatisé de Production Applications des Algorithmes Génétiques Hybrides
Résumé. Le principe d’un ordonnancement coopératif selon une modélisation multi-agents résulte du rapprochement des domaines de l’Ordonnancement et de l’Intelligence Artificielle Distribuée. Le travail que nous présentons dans ce papier a pour objectif l’étude de l’adéquation des métaheuristiques avancées dans un SMA dans le cadre de la résolution d’un problème d’optimisation bien défini qui es...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2008